Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Minería de Datos (PPT) (página 2)




Enviado por Pablo Turmero



Partes: 1, 2

Monografias.com

Proceso de la Minería
17
BD
Datos
Selección
Preprocesado
Selección de características
Extracción de conocimiento
Evaluación
Modelo
clasificador
Conocimiento

Monografias.com

Proceso de la Minería
Algoritmos de aprendizaje:
Mediante una técnica de Minería de Datos, se obtiene un modelo de conocimiento.
El modelo representa patrones de comportamiento observados en los valores de las variables o relaciones de asociación.
También pueden usarse técnicas para generar distintos modelos.
18

Monografias.com

Tipología de Técnicas de la Minería
Los métodos no supervisados, descubren:
patrones y
tendencias en los datos actuales.
El descubrimiento de esa información sirve para llevar a cabo acciones y obtener un beneficio de ellas.
19

Monografias.com

Taxonomía de la Minería
20
Data Mining
Verification Driven DM
Discovery Driven DM
SQL
SQL Generator
Description
Prediction
Query Tools
OLAP
Visualization
Clustering
Association
Secuential Association
Distillation
Clasification
Statistical
Regression
Decision Tree
Rule Induction
Neural Network

Monografias.com

Métodos de la Minería
Agrupamiento.
También se llama segmentación.
Identifica tipologías de grupos, donde se guarda similitud.
Se requiere información sobre el colectivo a segmentar.
La información corresponde a valores concretos.
Se basan en herramientas de carácter estadísticos, generación de reglas, redes neuronales,etc.
21

Monografias.com

Técnicas de la Minería
Métodos estadísticos.
Técnica tradicional en el tratamiento de grandes volúmenes de datos.
Existen varios modelos:
ANOVA (Análisis de Varianza). Contrasta con variables continuas.
Ji cuadrado. Contrasta con la independencia de variables.
Componentes principales. Permite reducir el número de variables.
22

Monografias.com

Técnicas de la Minería
Métodos estadísticos.
Análisis de clústers. Permite clasificar poblaciones.
Análisis de discrimante. Permite encontrar reglas de clasificación de elementos en grupos.
Regresión lineal. Se identifica una variable dependiente de las independientes, con una relación lineal.
Regresión logística. Trabaja con variables discretas, se requiere que las variables sean lineales.
23

Monografias.com

Técnicas de la Minería
Árboles de decisión.
Herramientas analíticas empleadas para el descubrimiento de reglas y relaciones.
Se construye partiendo el conjuntos de dos (CART) o más (CHAID).
Cada subconjunto a su vez es particionado.
Se continua hasta no encontrar diferencias significativas de influencia.
24

Monografias.com

Técnicas de la Minería
Reglas de asociación.
Derivan de un tipo de análisis que extrae información por coincidencias.
Permite descubrir correlaciones o co-ocurrencias en los sucesos de la base de datos.
Se formaliza la obtención de reglas del tipo SI… ENTONCES.
25

Monografias.com

Técnicas de la Minería
Redes neuronales.
Son capaces de detectar y aprender patrones y características de los datos.
Una vez adiestradas las redes pueden hacer previsiones, clasificaciones y segmentación.
Esto se realiza estructurando nivels o capas.
Se tienen dos tipos de aprendizaje: supervisado y no supervisado.
26

Monografias.com

Técnicas de la Minería
Algorítmos genéticos.
Hacen uso de técnicas de reproducción (mutación y cruce) para ser utilizadas para búsqueda y optimización.
Se parte de una población inicial, y se altera optimizándola.
Esta herramienta se usa en las primeras fases de la minería y después se aplica redes neuronales o regresión logística.
27

Monografias.com

Técnicas de la Minería
Lógica difusa.
Surge de la necesidad de modelar la realidad de forma mas exacta, evitando el determinismo y exactitud.
Permite el tratamiento probabilístico de categorización colectiva.
Trata la existencia de barreras difusas o suaves entre grupos.
28

Monografias.com

Técnicas de la Minería
Series temporales.
Consisten en el estudio de una variable a través del tiempo para que partiendo de ese conocimiento y con el supuesto de no cambios poder realizar predicciones.
Se basan en ciclos, tendencias y estaciones.
Se puede aplicar enfoques híbridos entre métodos anteriores, o con otro tipo de variables.
29

Monografias.com

Técnicas de la Minería
Redes bayesianas.
Son una alternativa para la minería.
Se tiene las ventajas:
Permiten aprender sobre relaciones de dependencia y causalidad.
Permiten combinar conocimiento de datos.
Evitan el sobre-ajuste de datos.
Permiten el manejo de bases de datos incompletas.
30

Monografias.com

Técnicas de la Minería
Inducción de reglas.
Como información de entrada, se tiene un conjunto de casos donde se ha asociado una clasificación o evaluación.
Con tal información se obtiene un árbol de decisión, que soportan la evaluación o clasificación.
En caso de que la entrada tenga ruido, esta técnica se puede habilitar con métodos estadísticos.
31

Monografias.com

Técnicas de la Minería
Sistemas basados en conocimiento y sistemas expertos.
Permiten la formalización de árboles y reglas de decisión, extraídas del conocimiento de expertos.
Poseen motores de inferencia, que gestionan las preguntas.
De esta forma el proceso de decisión es eficiente y rápido.
32

Monografias.com

Evaluación de la Minería
Selección de técnicas adecuadas.
El mínimo aceptable para elegir una tecnología de MD y un producto depende de qué tanto el producto beneficia al negocio:
Ingresos.
Costos disminuidos.
Rendimiento de inversiones.
Para desarrollar con éxito un negocio, el MD debe buscar algo más que patrones deseados.
33

Monografias.com

Evaluación de la Minería
Se tienen tres medidas claves, para una evaluación de las herramientas.
Precisión: Se deben modelos precisos, pero reconociendo pequeñas diferencias en las técnicas.
Explicación: Las herramientas deben explicar al usuario final de manera clara como funciona el modelo.
Integración: Las herramientas deben integrarse en el proceso real del negocio, flujos de datos e información de la empresa.
34

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter